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摘要 : 恒星 的 观测 谱 一 般 由 连续 谱 、 谱 线 和 噪声 组 成 。 其 中 连续 谱 是 由 黑体 辐射 导致 的 辐射 流 
量 随 波 长 变化 的 光滑 连续 光谱 。 光 谱 分 类 以 及 恒星 物理 参数 估计 等 研究 都 依赖 于 连续 谱 及 谱 线 
信息 的 准确 提取 。 因 此 光谱 数据 处 理 的 主要 工作 就 是 拟 合 连 续 谱 ， 并 通过 对 光谱 进行 归 一 化 来 
提取 谱 线 特征 。 目 前 连续 谱 拟 合 的 方法 主要 有 多 项 式 拟 合 、 中 值 滤波 、 小 波 滤波 等 。 已 有 的 方 
法 在 低 信 噪 比 ， 宇 宙 线 信号 干扰 ,， 存 在 发 射线 等 情况 下 ， 都 有 不 同 程度 的 局 限 性 ， 主 要 体现 在 
鲁 棒 性 和 准确 度 上 。 目 前 ,对 于 LAMOST 的 10 条 光谱 没有 自动 化 方法 应 用 到 归 一 化 上 , 在 天 文 
数据 雪 骨 的 时 期 ， 研 究 并 开发 一 种 能 够 适用 于 更 广 的 温度 、 信 噪 比 及 波长 覆盖 范围 的 ， 具 有 更 
好 普 适 性 并 能 够 自动 化 处 理 的 恒星 光谱 归 一 化 算法 ， 显 得 十 分 迫切 。 在 仔细 分 析 不 同类 型 光谱 
的 基础 上 ， 提 出 了 一 种 基于 固定 窗口 划分 的 连续 谱 拟 合 方法 。 该 方法 对 光谱 中 能 够 体现 连续 谱 
特征 的 数据 点 进行 筛选 提取 , 通过 细微 地 控制 样 条 画 数 平滑 度 来 产生 更 加 准确 的 连续 谱 。 使 用 
LAMOST 中 不 同 光 谱 型 、 温 度 范 围 、 波 长 覆盖 范围 的 光谱 进行 实验 ， 结 果 表 明文 章 提出 的 算法 
具有 良好 的 精度 和 普 适 性 。 
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作为 国家 重大 科学 工程 ，LAMOST 突破 了 天 文 望 远 镜 大 视 场 与 大 口径 难以 兼 得 的 难题 ， 
成 为 目前 国际 上 口径 最 大 的 大 视 场 望远镜 ,是 我 国光 学 望远镜 研制 的 又 一 里 程 碑 。 截至 2018 年 
6 月 LAMOST 完成 了 七 年 的 巡天 观测 ， 获 取 光 谱 数 首次 超 千 万 量 级 ， 也 成 为 世界 上 第 一 个 获取 
光谱 数 超 千 万 的 巡天 项 目 。 遗 憾 的 是 ， 对 于 LAMOST 的 10" 条 光谱 目前 没有 自动 化 方法 应 用 到 
归 一 化 上 上， 本文 主 要 对 这 一 步骤 进行 研究 。 

每 条 观测 谱 都 由 连续 谱 、 谱 线 和 噪声 组 成 ” 。 通 过 谱 线 可 以 对 恒星 的 化 学 组 成 进行 分 析 ， 
并 且 由 于 多 普 勒 效应 ， 谱 线 还 携带 着 视 向 速度 的 信息 。 因 此 ， 从 原始 光谱 中 准确 的 提取 谱 线 是 
恒星 光谱 研究 及 光谱 数据 处 理工 作 中 的 重要 步骤 ， 对 后 续 的 研究 有 着 重要 意义 。 
要 消除 连续 谱 首先 要 对 连续 谱 进 行 拟 合 。 已 有 的 连续 谱 拟 合 方法 主要 有 : 多 项 式 拟 合 、 中 

和 vb MEY 这 yE Y gax Pl dr- *-H- AS \ = y 3 Ap 
值 滤波 、 小 波 滤波 、 形 态 滤波 器 等 ”。 也 有 利用 天 文 软件 进行 半自动 处 理 的 方法 : 首先 人 工 筛 

[4] 

选 提取 认为 合适 的 数据 点 “并 选择 函数 形式 ， 然 后 由 软件 进行 多 项 式 拟 合 ， 最 后 得 到 连续 谱 。 
这 种 方法 依赖 人 工 参 与 ， 无 法 满足 日 前 巡天 项 目 中 海量 光谱 的 实时 处 理 需求 。 国 外 的 斯 隆 巡 天 
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MH (SDSS) 中 的 数据 处 理 程序 SSPP (the segue stellar parameter pipeline) 采用 的 方法 是 分 段 
多 项 式 拟 合 。 首 先 将 光谱 分 为 红 端 和 蓝 端 两 个 部 分 ， 去 除 强 巴尔 末 线 系 以 后 ， 对 蓝 端 使 用 9 
阶 ， 红 端 使 用 4 Grae NWA, EF 3 个 标准 差 以 外 的 数据 点 。 然 后 拼接 两 段 连续 谱 再 进 
行 一 次 9 阶 多 项 式 拟 合 ， 得 到 最 终 的 连续 谱 。 这 种 方法 稍 显 繁琐 ， 且 计算 量 大 。 

本 文 提 出 的 方法 将 光谱 划分 为 数 个 固定 的 〈 包 含 相同 像素 数量 ) 窗口 ， 窗 口内 选中 值 点 ， 
然后 通过 筛选 策略 丢弃 部 分 参考 点 ， 能 够 非常 有 效 地 避 开 发 射线 、 吸 收 线 及 宇宙 线 。 并 且 通 过 
对 参考 点 之 间 “ 夹 角 ” 的 控制 ， 可 以 使 用 非常 小 的 平滑 度 来 构造 样 条 曲线 ， 实 现 对 连续 谱 的 精 
确 拟 合 。 


1 方法 介绍 


本 文 提出 的 连续 谱 归 一 化 方法 大 体 上 包含 三 个 步 又: 首先， 将 一 条 待 处 理光 谱 根据 数据 点 
总 数 划分 为 数 个 窗口 ， 每 个 窗口 选 出 流量 中 值 点 形成 参考 点 集 ;， 其 次 ， 制 定 了 一 些 筛选 策略 ， 
对 参考 点 集中 有 可 能 影响 拟 合 结果 的 数据 点 进行 丢弃 。 最 后 ， 根 据 参 考点 流量 最 大 值 押 在 波长 
位 置 选取 对 应 的 样 条 函数 平 请 度 经 验 值 进行 拟 合 ， 得 到 连续 谱 。 
1.1 划分 窗口 构造 参考 点 集 

为 了 有 足够 的 数据 点 作为 拟 合 函 数 的 控制 点 ， 根 据 输 入 的 待 处 理光 谱 数据 点 总 数 ， 采 用 如 
下 策略 划分 窗口 。 设 数据 点 总 数 为 n， 每 个 窗口 包含 像素 数 ， 即 窗 宽 为 w: 


表 1 窗 宽 与 数据 点 总 数 之 间 的 对 应 关系 
Tab 1. The relationship between windows width and the total number of data points 
n 0~1000 1000~1500 1500~2500 2500~3500 3500~4500 4500~ n 


w 13 15 17 19 21 23 


根据 上 表 确 定 窗 宽 以 后 对 光谱 进行 窗口 划分 ， 然 后 遍历 所 有 窗口 ， 每 个 窗口 内 选取 流量 值 
等 于 窗口 中 所 有 点 中 值 的 像素 作为 参考 点 ， 并 将 其 加 入 参考 点 集 Spo 
12 筛选 参考 点 
由 上 一 步骤 构造 的 参考 点 集 5,, 只 是 体现 了 光谱 的 大 致 形状 , 其 中 有 些 点 可 能 位 于 吸收 线 或 
者 发 射线 上 ， 如 图 : 
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图 1 有 些 参考 点 位 于 吸收 线 上 
Fig. 1 Some reference points are on the absorption line 
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图 2 有 些 参考 点 位 于 发 射线 上 


Fig. 2 Some reference points are on the emission line 
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连续 谱 理 论 上 应 非常 接近 黑体 辐射 谱 ， 而 黑体 谱 可 以 划分 为 两 个 单调 区 间 ， 峰 值 左 边 是 单 


调 增 区 间 ， 右 边 是 单调 减 区 间 ”， 所 以 我 们 希望 用 来 构造 拟 合 曲 线 的 参考 点 能 够 符合 并 体现 这 
一 特征 。 为 了 实现 这 一 目标 ， 采 取 了 两 个 步骤 对 参考 点 集 再 次 筛选 。 


(1). 于 弃 局 部 极 小 值 点 : 


设 5,, 中 一 个 参考 点 的 索引 为 i REA H iE: 
fi-1)> fOO <fGü+1), i>=1 a) 
则 将 参考 点 i 从 Syp 中 删 去 。 每 次 从 i=1 开始 到 遍历 完 Sip 中 所 有 参考 点 结束 为 趟 , EMER 


结束 的 时 候 ， 可 能 还 会 有 些 点 成 为 新 的 局 部 极 小 值 点 ， 此 时 需要 再 丢弃 一 趟 。 设 丢弃 的 趟 数 为 


t, 我 们 需要 保证 以 下 两 点: 对 连续 谱 正 常 的 光谱 ，t 次 丢弃 之 内 gm 中 元 素数 量 已 经 不 再 减少 ; 
对 于 连续 谱 异 常 的 光谱 , t KRR Sp 中 还 有 足够 的 参考 点 用 来 构造 拟 合 曲线 。 实 验 表 明 ， 


合适 的 + 取 值 为 t = len(S,,)//30 + 2. 


经 这 一 步骤 处 理 后 ， 图 1 和 图 2 中 两 条 光谱 的 参考 点 集 如 下 图 : 
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图 3 图 1 中 光谱 经 z 次 丢弃 局 部 极 小 值 以 后 的 参考 点 集 
Fig. 3 The reference point set after the local minimum is discarded t times in the spectrum in Fig. 1 
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图 4 图 2 中 光谱 经 1 次 丢弃 


局 部 极 小 值 以 后 的 参考 点 集 


Fig. 4 The reference point set after the local minimum is discarded t times in the spectrum in Fig. 2 
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为 了 获得 更 加 精确 的 连续 谱 拟 合 曲线 ， 我 们 需要 较 小 的 平滑 度 来 构造 样 条 函数 。 这 时 ， 如 
果 有 的 参考 点 和 其 左右 两 点 连 线 构成 的 夹 角 过 大 ， 则 会 给 拟 合 曲线 带 来 较 大 的 偏离 ， 这 样 的 参 


考点 应 从 5 中 删 去 。 如 图 5 所 示 。 
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图 5. 位 于 发 射线 上 的 那个 数据 点 应 从 参考 点 集中 删 去 


Fig 5 The data point on the emission line should be removed from the reference point set 
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图 6 使 用 余弦 定理 计算 夹 

Fig. 6 Calculate the angle by use of Cosine theorem 
如 图 6 所 示 ， 在 参考 点 集中 取 一 点 i, 设 其 对 应 的 波长 为 w(i)， 流 量 为 1(i)， 与 它 左 右 两 点 
连 线 的 夹 角 为 9(i)， — 角形 边 长 分 别 为 a, b, c. 在 几何 上 ， 有 : 


has w(i- DP +O- fi- Q) 
[wG + 1) — w(D]2 + [/G + 1) — f GË, (3) 
c= ep (4) 


根据 余弦 定理 便 可 计算 出 9(i) 的 值 。 实 际 上 ,流量 值 并 不 对 应 长 度 单位 ，w 和 了 的 单位 很 难 
统一 。 同 时 ， 由 于 我 们 的 光谱 数据 中 流量 是 未 定 标 的 相对 流量 ， 直 接 用 余弦 定理 计算 出 的 夹 角 
会 随 着 光谱 流量 值 所 在 的 区 间 不 同 ， 以 及 光谱 数据 处 理 中 必要 的 乘除 运算 而 变化 。 为 此 ， 我 们 
做 如 下 处 理 : 

对 于 gz 中 的 一 个 参考 点 六， 设 其 与 左边 数据 点 波长 数值 的 差 为 wd-， 右 边 为 wd+， 则 :; 


wd = w(i) — w(i — 1) (5) 
f wdt = w(i + 1) — w(i) (6) 
同 理 ， 对 于 流量 值 

fa =f@-ft-1) (7) 
fat = fü + 1) — fÒ (8) 

引入 比例 因子 fw 六， 令 : 

wa 

Tw = wapwar ©) 


六 去 十 (10) 
最 后 ， 计 算 判 据 r = |w, 一 六 | 的 值 并 引入 阔 值 mn， 若 > > rm， 则 认为 点 i 属于 夹 角 较 大 的 点 ， 
会 给 精确 拟 合 带 来 干扰 ， 应 从 Sp 中 除去 。 通 过 实验 ， 我 们 发 现 效果 较 好 的 m 取 值 为 0.5。 
如 此 ， 通 过 比值 来 消去 量 纲 ， 则 不 论 w 与 了 取 何 种 单位 ，n,ry 都 是 不 变 的。 使 用 n,,ry 作 为 
判断 依据 来 寻找 这 样 的 参考 点 更 为 可 靠 。 图 5 中 光谱 经 此 步骤 处 理 后 的 结果 如 图 7 所 示 。 
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图 7 位 于 发 射线 上 的 参考 点 被 成 功 移 除 


Fig.7 The reference point on the emission line was Successfully removed 


13 平滑 度 计算 

样 条 函数 拟 合 效果 的 好 坏 ， 除 了 与 参考 点 的 选取 有 关 ， 还 决定 于 平滑 度 的 选择 。 对 于 同 
一 条 光谱 ， 同 样 的 参考 点 集 ， 不 同 的 平滑 度 会 有 不 同 的 效果 ， 如 图 8 所 示 。 
较 小 的 平滑 度 可 以 更 好 的 照顾 到 光谱 图 像 上 起 伏 的 细节 ， 但 过 小 就 容易 产生 振动 频繁 的 现 
象 ， 使 拟 合 曲 线 无 法 体现 连续 谱 ， 较 大 的 平滑 度 不 会 有 剧烈 的 振动 ， 但 是 过 大 会 使 拟 合 曲 线 过 
于 平缓 ， 也 无 法 很 好 的 体现 连续 谱 。 应 该 指出 的 是 ， 对 于 同一 个 平滑 度 ， 在 不 同 的 流量 区 间 ， 
样 条 曲线 也 会 有 不 同 的 表现 。 我 们 在 拟 合 之 前 ， 都 将 光谱 数据 进行 了 最 大 值 标准 化 ， 即 
flux = flux/max(flux). 
经 实验 分 析 ， 温 度 越 高 的 光谱 需要 越 小 的 平滑 度 来 照顾 光谱 在 蓝 端 较 急 剧 的 转折 ， 温 度 越 
低 的 光谱 需要 越 大 的 平滑 度 来 弱化 参考 点 上 下 起 伏 的 趋势 。 而 一 条 光谱 的 温度 在 连续 谱 上 体现 
为 流量 峰值 所 在 的 位 置 。 我 们 采用 在 参考 点 集中 选取 流量 最 大 值 ， 用 其 所 在 波长 位 置 来 估计 访 
条 光谱 的 温度 区 间 ， 选 择 对 应 的 平滑 度 sy 。 并 且 ， 为 了 能 够 适用 于 局 部 归 一 化 的 场合 ， 对 于 参 
考点 较 少 的 情况 ， 需 要 更 小 的 平滑 度 。 为 此 引入 默认 值 为 1 的 比例 系数 c, 用 于 在 参考 点 较 少时 
将 之 与 so 相 乘 的 结果 作为 最 终 的 平滑 度 取 值 。 具 体 数据 开 列 在 表 2 和 表 3 中 。 

最 终 在 构造 样 条 曲线 的 时 候 使 用 的 平滑 度 为 : s = c = so GD) 
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8 平滑 度 对 拟 合 曲线 的 影响 


Fig 8 The influence of smoothing factor on fitting curve 


表 2 根据 参考 点 集中 流量 最 大 值 点 所 在 波长 位 置 选择 平滑 度 
Tab. 2 Selection of smoothing factor according to the wavelength position of the maximum flux 
point in the reference point set 
wave(A) 3700~4760 4760-6880 6880-7940 7940-9000 


So 0.01 0.02 0.03 0.05 


表 3 根据 参考 点 集中 数据 点 数 n 选择 平滑 度 比例 系数 c 
Tab. 3 Selection of proportionality coefficient c of smoothing factor according to the number of 
data points n in the reference point set 
n 1~29 30~59 60~89 90~119 120~149 150~180 


c 0.2 0.35 0.5 0.65 0.8 1 
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2 ”实验 结果 


2.1 不 同情 况 下 的 处 理 结果 


为 检验 所 提出 的 方法 的 处 理 效果 , 从 LAMOST 中 随机 # 


验 。 


从 中 选 出 不 同 温度 的 光谱 进行 拟 合 ， 如 图 9 Bias. APA 
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由 取 了 不 同类 型 光谱 10000 条 进行 实 


E 侧 蓝 色 实 线 为 原始 光谱 ， 红 色 实 


线 为 拟 合 曲线 ， 右 侧 绿色 实 线 为 对 应 的 归 一 化 谱 。 由 图 可 见 本 文 所 提出 的 方法 在 不 同 温度 下 ， 


均 做 到 了 较 好 的 拟 合 。 


线 为 对 应 的 归 一 化 谱 。 


不 需 人 工 干预 。 


不 大 。 与 文献 [9] 中 专 为 低 质量 光谱 开发 的 归 一 化 方法 处 理 效果 非常 接近 。 


2.2 误差 分 析 和 适用 范 


如 图 12 所 示 , 在 光谱 中 含有 发 射线 及 宇宙 线 的 情况 下 ,本 方法 仍 能 有 效 识别 并 进行 准确 的 


H 


如 图 10 所 示 ， 左 侧 桃红 色 实 线 是 原始 光谱 ， 绿 色 实 线 为 样 条 函数 拟 合 曲线 ; A EE (6 sk 
选取 不 同 的 波长 覆盖 范围 以 后 ， 本 方法 能 够 较 好 的 工作 ， 这 使 得 本 方法 
能 够 自动 适用 于 需要 局 部 归 一 化 的 场合 ， 
如 图 11 所 示 ， 左 侧 是 原始 光谱 及 拟 合 曲线 ， 在 不 同 信 噪 比 情况 下 ， 本 方法 拟 合 效果 受 影响 


由 于 仪器 原因 ，LAMOST 光谱 中 常见 的 仪器 形变 模式 有 3 种 ， 如 图 8 左 侧 子 图 所 示 。 为 了 


测试 本 文 提 出 的 方法 是 否 能 够 有 效 地 处 理 这 些 仪 器 导致 的 光谱 形变 ， 在 有 效 温度 4000~8000K 
的 范围 内 随机 抽取 9 条 光谱 , 每 条 光谱 归 一 化 后 的 结果 都 乘 以 这 3 种 形变 曲线 , 并 再 次 归 一 化 。 


图 8 右 侧 子 图 所 示 的 直方 图 


的 平均 值 在 10° 量 级 ， 


误差 弥散 在 10°? BAK. 


经 实验 分 析 ， 本 文 所 提出 的 算法 适用 范围 如 下 : $<SNR<600， 波 长 覆盖 范围 


P 显示 的 是 两 次 归 一 化 结果 残 差 的 分 布 ， 可 以 看 出 本 文 算法 的 误差 


3700~9000Å, 


有 效 温度 范围 3000~50000K。 其 中 ， 信 品 比 在 低 于 5 的 时 候 算法 处 理 结果 变 得 不 稳定 ， 总 体 精 


度 有 随 着 信 品 比 下 降 而 降低 的 趋势 。 有 效 温度 小 于 3000K 的 光谱 处 理 结果 同样 不 稳定 ， 大 量 光 


谱 总 结果 变 得 不 可 信 。 


温度 高 于 50000K 的 光谱 未 做 实验 。 并 


参数 进行 微调 。 


除 此 之 外 ， 信 噪 比 高 于 600， 波 长 范围 小 于 3700A 或 大 于 9000A， 有 效 


， 本 算法 适用 于 中 低 色散 的 光谱 ， 高 色散 光谱 需要 对 


需要 指出 ， 对 于 本 文 算 法 涉及 的 参数 : w brosoc. 这 些 参数 值 的 选择 是 为 了 适应 仪器 特性 ， 


对 于 其 他 来 源 的 光谱 ， 


方法 仍然 可 用 但 参数 初 值 需要 略微 调整 。 
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图 8 LAMOST 仪器 的 形变 模式 及 归 一 化 误差 分 析 


Fig. 8Deformation mode in LAMOST and error analysis of normalization 
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3 ”结论 与 展望 


归 一 化 是 光谱 数据 处 理 中 的 重要 环节 ， 这 一 步 又 处 理 结果 的 准确 度 将 直接 影响 后 续 数 据 分 
析 结 果 的 正确 性 以 及 精确 程度 。 为 了 获得 更 加 准确 的 连续 谱 ， 在 国内 外 研究 的 基础 上 提出 了 基 
于 固定 窗口 划分 的 样 条 函数 拟 合 方法 ， 通 过 大 量 实验 修正 其 中 某 些 参数 的 经 验 取 值 。 随 后 ， 使 
用 更 多 的 数据 进行 验证 ， 结 果 表 明 本 方法 在 拓宽 适用 范围 的 前 提 下 实现 了 自动 处 理 ， 与 其 他 方 
法 相 比 具 有 更 好 的 普 适 性 ， 在 需要 大 规模 自动 化 处 理 的 场合 有 独特 的 优越 性 。 

恒星 光谱 的 归 一 化 方法 有 很 多 种 ， 在 不 同 的 场合 下 各 有 优 劣 。 本 文 算法 致力 于 实现 
LAMOST 海量 光谱 实时 处 理 的 自动 化 进行 及 普 适 性 拓展 。 涉 及 到 的 参数 值 都 是 在 大 量 实验 的 基 
础 上 ， 由 经 验 总 结 出 来 的 。 另 外 ， 在 开发 算法 的 过 程 中 ， 有 一 个 重要 问题 未 得 到 很 好 的 解决 。 
即 缺乏 一 个 严格 的 最 优 解 评价 标准 来 衡量 归 一 化 结果 的 好 坏 , 使 得 算法 仅 能 对 一 些 明显 的 错误 ， 
如 连续 谱 出 现 负 值 ， 做 出 基本 的 容错 处 理 。 如 果 能 够 研究 出 可 量化 并 且 方 便 计 算 机 实现 的 归 一 
化 结果 评价 标准 ， 则 可 以 对 处 理 结果 进行 评价 ， 通 过 参数 自动 修改 适应 来 再 次 处 理 直 至 获得 最 
优 解 。 

随 着 天 文 数据 的 急剧 增长 ， 我 们 还 需要 更 加 高 效 和 智能 的 归 一 化 方法 及 数据 处 理 程序 。 下 
一 步 将 进行 低温 星 、 特 殊 星 如 碳 星 等 的 光谱 归 一 化 研究 。 
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图 9 不 同 温度 下 的 归 一 化 结果 


Fig. 9 Normalization results at different temperatures 
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图 10 不 同 波长 覆盖 范围 的 归 一 化 结果 


Fig 10 Normalization results of different wavelength coverage range 
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图 11 不 同 信 品 比 下 的 归 一 化 结果 
Fig 11 Normalization results under different SNR 
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图 12 含有 发 射线 或 宇宙 线 的 情况 


Fig. 12 Circumstances containing emission lines or cosmic rays 
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Automatic normalization method of stellar spectrum 


based on spline function 
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Abstract:The observed spectrum of stars is generally composed of continuous spectrum, 
spectral line and noise.The continuous spectrum is the smooth continuous spectrum of radiation 
flux varying with wavelength caused by blackbody radiation.Spectral classification and stellar 
physical parameter estimation depend on the accurate extraction of continuous spectrum and 
spectral line information.Therefore, the main work of spectral data processing is to fit continuous 
spectrum and extract spectral line features by normalization.At present, the methods of continuous 
spectrum fitting mainly include polynomial fitting, median filtering and wavelet filtering.Existing 
methods have limitations to varying degrees in the case of low SNR, interference of cosmic ray 
signals and existence of emission lines, which are mainly reflected in robustness and accuracy.For 
the time being, there is no automated method applies to the normalization of the 10’spectra from 
LAMOST.In the period of avalanche of astronomical data, it is very urgent to research and 
develop a spectral normalization algorithm of stars with better universality and automatic 
processing that can be applied to a wider range of temperature, SNR and wavelength coverage.On 
the basis of careful analysis of different types of spectra, a continuous spectrum fitting method 
based on fixed window dividing is proposed.This method can filter and extract the data points in 
the spectrum which can reflect the characteristics of continuous spectrum, and produce more 
accurate continuous spectrum by fine controlling the smoothness of spline function.Experiments 
were carried out using spectra of different spectral types, temperature ranges and wavelength 
coverage ranges in LAMOST, and the results showed that the proposed algorithm had good 


accuracyanduniversality. 


Key words:Continuous spectrum normalization; LAMOST; stellar spectrum; 
Spline function 


